在通过梯度下降训练过度参数化的模型函数时,有时参数不会显着变化,并且保持接近其初始值。该现象称为懒惰训练,并激发了对模型函数围绕初始参数的线性近似的考虑。在懒惰的制度中,这种线性近似模仿了参数化函数的行为,其相关内核称为切线内核,指定了模型的训练性能。众所周知,在宽度较大的(经典)神经网络的情况下进行懒惰训练。在本文中,我们表明,几何局部参数化量子电路的训练进入了大量Qubits的懒惰制度。更准确地说,我们证明了这种几何局部参数化量子电路的变化速率,以及相关量子模型函数的线性近似的精确度;随着Qubits的数量的增加,这两个边界都趋于零。我们通过数值模拟支持我们的分析结果。
translated by 谷歌翻译
尽管进行了数十年的研究,但现有的导航系统在野外部署时仍然面临现实世界中的挑战,例如在混乱的家庭环境或人类占领的公共场所中。为了解决这个问题,我们提出了一类新的隐式控制政策,将模仿学习的好处与模型预测控制(MPC)的系统约束的强大处理结合在一起。我们的方法称为Performer-MPC,使用了通过表演者提供的视觉上下文嵌入的学习成本函数(一种低级隐式意见变压器)。我们共同训练成本函数并构建依靠它的控制器,有效地端到端解决相应的双层优化问题。我们表明,由此产生的策略通过利用一些在不同挑战的现实世界情景中利用一些专家演示来提高标准MPC绩效。与标准的MPC政策相比,表演者MPC在混乱的环境中实现了40%的目标,而在人类浏览时,社交指标的目标> 65%。
translated by 谷歌翻译
随着机器人越来越多地进入以人为本的环境,他们不仅必须能够在人类周围安全地浏览,还必须遵守复杂的社会规范。人类通常在围绕他人围绕他人(尤其是在密集占据的空间中)时,通常通过手势和面部表情依靠非语言交流。因此,机器人还需要能够将手势解释为解决社会导航任务的一部分。为此,我们提出了一种新型的社会导航方法,将基于图像的模仿学习与模型预测性控制结合在一起。手势是基于在图像流中运行的神经网络来解释的,而我们使用最先进的模型预测控制算法来求解点对点导航任务。我们将方法部署在真实的机器人上,并展示我们的方法对四个手势游动场景的有效性:左/右,跟随我,然后圈出一个圆圈。我们的实验表明,我们的方法能够成功地解释复杂的人类手势,并将其用作信号,以生成具有社会符合性的导航任务的轨迹。我们基于与机器人相互作用的参与者的原位等级验证了我们的方法。
translated by 谷歌翻译
生成精确反映客户行为的表示形式是在Alexa提供个性化技能路由体验的重要任务。目前,负责将Alexa流量路由到提供商或技能的动态路由(DR)团队依赖于两个功能作为个人信号:每个客户的每种技能使用情况的绝对交通计数和规范化的交通计数。他们俩都没有考虑基于网络的结构来进行客户与技能之间的交互,这些结构包含更丰富的信息以获得客户的喜好。在这项工作中,我们首先构建了基于图形的客户与调用技能的过去交互,在该技能中,用户请求(说服)被建模为边缘。然后,我们提出了一个基于图形卷积网络(GCN)的模型,即个性化的动态路由功能编码器(PDRFE),该模型生成了从构建图中学到的个性化客户表示。与现有模型相比,PDRFE能够在图形卷积函数中进一步捕获上下文信息。我们提出的模型的性能通过下游任务,缺陷预测来评估,该任务可预测从客户的嵌入及其触发技能的嵌入中的缺陷标签。与基准相比,我们提出的模型的跨熵度量提高了多达41%的改善。
translated by 谷歌翻译
本文介绍了多代理系统中混合代理的开发的尴尬架构。尴尬的代理商可以实时重新配置他们的计划,以便在不断变化的环境和社会环境下与社会角色要求保持一致。拟议的混合体系结构利用面向行为的设计(BOD)来开发具有反应性计划和完善的歌剧框架的代理,以提供组织,社交和互动定义,以验证和调整代理的行为。 Opera和Bod可以共同实现代理计划的实时调整,以实现不断发展的社会角色,同时为促进各个代理商的行为变化的互动提供了透明度的额外好处。我们介绍了这种体系结构,以激发传统的符号和基于行为的AI社区之间的桥接,在该社区中,这种合并的解决方案可以帮助MAS研究人员追求建立更强大,更强大的智能代理团队。我们使用DOTA2,这是一种成功取决于社交互动的游戏,作为证明我们提出的混合体系结构的示例实现的媒介。
translated by 谷歌翻译
在早期设计阶段,应为所需室内环境质量(IEQ)进行太阳阴凉设计。这个领域可能非常具有挑战性和耗时需要专家,复杂的软件和大量的钱。本研究的主要目的是设计一个简单的工具来研究各种型号的太阳阴影,并在早期阶段更容易且更快地做出决定。数据库生成方法,人工智能和优化已被用于实现这一目标。该工具包括两个主要部分。预测用户所选模型的性能以及提出有效参数和2.向用户提出最佳预准备模型。在这方面,最初,具有可变参数的侧向升鞋盒模型是参数建模的,并且将五种常见的太阳阴影模型应用于空间。对于每个太阳阴影和没有阴影的状态,模拟了与日光和眩光,视图和初始成本有关的指标。本研究中生成的数据库包括87912个替代和六个计算的指标,引入优化的机器学习模型,包括神经网络,随机Forrest,支持向量回归和K最近邻居。根据结果​​,最准确和最快的估计模型是随机的Forrest,R2_Score为0.967至1.然后,进行敏感性分析以确定每个阴影模型的最有影响力的参数和没有它的状态。这种分析区分了最有效的参数,包括窗口方向,WWR,房间宽度,长度和阴影深度。最后,通过利用NSGA II算法优化机器学习模型的估计功能,识别了大约7300个最佳模型。开发的工具可以为每个设计的各种设计替代品评估各种设计替代品。
translated by 谷歌翻译
由于问题的大规模性质,机器学习算法中的封锁率调整是一种计算挑战性的任务。为了开发高参数调整的有效策略,一个有希望的解决方案是使用群体智能算法。人造蜜蜂殖民地(ABC)优化为此目的作为一个有希望有效的优化算法。然而,在某些情况下,由于初始解决方案较差和昂贵的客观函数,ABC可能遭受缓慢的收敛速度或执行时间。为了解决这些问题,提出了一种新颖的算法,OPTABC,以帮助ABC算法更快地达到近最佳解决方案。 Optabc集成了人造蜂殖民地算法,K均值聚类,贪婪算法和基于反对的学习策略,用于调整不同机器学习模型的超参数。 Optabc采用这些技术,以试图多样化初始群体,因此增强了收敛能力,而不会显着降低准确性。为了验证所提出的方法的性能,我们将结果与先前的最先进的方法进行比较。实验结果表明,与文献中的现有方法相比,Optabc的有效性。
translated by 谷歌翻译
类似于心血管和肌肉骨骼系统的熟练程度的差异如何预测个人的运动能力,同一大脑区域如何编码个人的差异可以解释他们的行为。然而,在研究大脑如何编码信息时,研究人员选择不同的神经影像任务(例如,语言或电机任务),其可以依赖于处理不同类型的信息并且可以调制不同的脑区。我们假设信息如何在大脑中编码信息的个人差异是特定于任务的,并预测不同的行为措施。我们提出了一种使用编码模型的框架,以识别大脑编码和测试中的单个差异,如果这些差异可以预测行为。我们使用任务功能磁共振成像数据评估我们的框架。我们的结果表明,编码模型显示的个体差异是预测行为的强大工具,并且研究人员应优化他们对其感兴趣行为的任务和编码模型的选择。
translated by 谷歌翻译
备忘录是一种非线性的两端电气元件,具有内存特征和纳米级特性,使我们能够设计出非常高密度的人工神经网络。为了增强内存属性,我们应该使用能够这样做的数学框架等数学框架。在这里,我们首先提出了两个神经元上的分数阶突触耦合Hopfield神经网络,然后将模型扩展到具有环形结构的神经网络,该神经网络由N子网络神经元组成,从而增加了网络中的同步。研究了平衡点稳定性的必要条件,突出了稳定性对分数值值和神经元数的依赖性。数值模拟和分叉分析以及Lyapunov指数在两种神经元的情况下进行了证实,该情况证实了理论发现,表明当系统的分数增加时,可能会导致混乱的途径。在N-Neuron情况下,据揭示了稳定性取决于子网络的结构和数量。
translated by 谷歌翻译
In this work, we consider the problem of learning a feed-forward neural network controller to safely steer an arbitrarily shaped planar robot in a compact and obstacle-occluded workspace. Unlike existing methods that depend strongly on the density of data points close to the boundary of the safe state space to train neural network controllers with closed-loop safety guarantees, here we propose an alternative approach that lifts such strong assumptions on the data that are hard to satisfy in practice and instead allows for graceful safety violations, i.e., of a bounded magnitude that can be spatially controlled. To do so, we employ reachability analysis techniques to encapsulate safety constraints in the training process. Specifically, to obtain a computationally efficient over-approximation of the forward reachable set of the closed-loop system, we partition the robot's state space into cells and adaptively subdivide the cells that contain states which may escape the safe set under the trained control law. Then, using the overlap between each cell's forward reachable set and the set of infeasible robot configurations as a measure for safety violations, we introduce appropriate terms into the loss function that penalize this overlap in the training process. As a result, our method can learn a safe vector field for the closed-loop system and, at the same time, provide worst-case bounds on safety violation over the whole configuration space, defined by the overlap between the over-approximation of the forward reachable set of the closed-loop system and the set of unsafe states. Moreover, it can control the tradeoff between computational complexity and tightness of these bounds. Our proposed method is supported by both theoretical results and simulation studies.
translated by 谷歌翻译